Gemini 2.5 Flash Image
米Googleは8月26日(現地時間)、新たな画像生成AIモデル「Gemini 2.5 Flash Image」(通称:nano-banana)を発表した。3月に発表した前モデル「Gemini 2.0 Flash」に比べ、複数の画像を生成する際に画像内の人やモノの一貫性を保持する機能や、自然言語の指示による画像編集の性能などを強化したという。 今回のアップデートでは、複数の画像を自然に融合する機能や、同一キャラクターを異なるシーンで描画する一貫性維持機能、自然言語による精密な画像編集、Geminiモデルの持つ広範な知識の活用が可能になりました。 単なる画像生成に留まらず、より実用的な編集・対話機能が統合された点が大きな特徴です。
Soraは技術的な特異点で、すごいけど数カ月経てば追いつくものが出るだろうと思ったけど、nano-bananaは製品として綺麗すぎる
オープンソースが好きなのであまり使いたくないけど、縛りプレイという意味では手書きにこだわってる人間と同じになってやしないかと思えてくる
文字もちゃんと変わっててすごい
今までは素材から毎回新たなものを生成していたのが、AIで編集してる感じがある
https://gyazo.com/07ed9286708f67379040c508d3eebab7
すごいcak.icon
下の文字もバナナになっててすごいHiro Aki.icon
nano-bananaは画像生成モデルじゃなくて、MLLMの新しいUI/UXだと思うとしっくりくるnomadoor.icon ゲーム画面も選択肢も画像で出力させて、nano-banana上だけで動作するRPG
これからのローカル画像生成がどうのこうの言っていたけど、MLLMがありとあらゆるモーダルに入出力の手を伸ばすなら、こんなものじゃ済まないな
Google AI Studioで試してみたけど「画像を生成しますね」と言うだけで画像が生成されないyosider.icon
日本語プロンプトだと生成されない場合があるらしい、英語にしたら生成された
inajob.icon
生成AIに着色してもらうのが出来るようになったのかー
https://gyazo.com/3f9b0e820fa12c4e074ea329d72a43b1
https://gyazo.com/7049d680d3fd3fdf8109a7a4cec2ba29
https://gyazo.com/2a78e62de87da5faaa20fcd3b5bd6bb5
なるほどー
白黒画像をカラー化は時々史料映像で見かけたけど、一般家庭で出来るようになるまで技術が降りてきた感じか、すごいHiro Aki.icon
線画の清書も前はもっと下手だった気がするinajob.icon
基素.icon雑に渡したら漫才みたいな返しをしてきた